研读 | WAIC2022回顾 (2):通用智能与认知智能改变世界
The following article is from Mindverse Research Author 心识宇宙团队
人工智能对元宇宙的建设可以在基础设施、交互与生态三个层次上多维度结合。在上一期对今年世界人工智能大会(WAIC)的回顾中,我们已经总结了 AI 对元宇宙 3D 场景和内容建设的分享和研究。在本次回顾中,我们将分享与通用智能和认知智能相关的内容,以探索关于元宇宙场景的信息入口与生产要素。
目 录
✦
智能本质与第一性原理
认知智能科学:基于脑与认知科学的人工智能
意识图灵机:一种可解释的人工智能
✦
✦
智能本质与第一性原理
美国加州大学伯克利分校电子工程的马毅做了分享《智能本质与第一性原理》,是对前不久发表的论文《On the Principles of Parsimony and Self-Consistency for the Emergence of Intelligence》的解读。马毅试图解决关于智能的两个基本问题:学习什么以及如何学习。马毅认为智能学习要满足简洁性(Parsimony)和自洽性(Self-consistency)两个基本原则,这是人工或自然智能涌现的基石。
两个原则的总体框架如下。可以看到它不仅适合视觉,对触觉、听觉以及多感官模态过程同样适用。
在这样的框架下,智能将作为一个整体的整合系统,而不是大脑功能分化、对各种任务特化的诸多模块。
认知智能科学:基于脑与认知科学的人工智能
清华大学基础科学讲席教授刘嘉题为《Cognitive NeuroIntelligence AI of Brain Cognition》的分享。在他看来,智能可以根据开放—封闭,静态—动态两个维度分为四种,分别是
强化学习:计划 & 决策 计算视觉:检测 & 分类 控制论:漫游 & 觅食 强人工智能(AGI):开放任务&环境
但对生物智能而言,尺度不是问题。从线虫到人脑,都能具备以上四种智能。只不过随着规模和复杂度增加,智能所面对的任务复杂度也有所增加。但不管哪个尺度,生物智能都能在极少成本下解决传统AI消耗巨大的问题。因此人工智能下一步发展是生物或脑启发AI(Brain-inspired Al)。
生物神经元受到时间、空间和材料等经济成本制约,并且受体积、新陈代谢、信号延迟和衰减以及发育过程等限制。因此首先可以从生物智能学习的是其具有:1. Wiring Cost Minimization(布线成本最小化)。这可以被理解为一个赢者通吃的自组织优化过程。
接着是 2. Cortical Point Spread(皮层细胞质点扩散过程)。即由外部刺激引发的神经活动向侧面扩散,从最初点火的神经元到周围的神经元,通过其轴突投射到附近的神经元。
在网格中赢家单元 的邻域用以下公式更新,其中 是邻域函数,由高斯形式给出。
最后是 3. Modularity(形成模块化),模块一种专门用于解决特定信息处理问题的神经基质。例如结构约束下的赫布学习规则(Hebbian rule)
刘嘉认为在这三种启发下,可以建立基于自组织映射的人工皮质界面。
但正如W.Duran所言「我们所知道的世界是我们所构建的。在这个构建的世界里,我们的心灵提供了构建的模具,而外部世界则提供了原料」,又如David Marr所言「了解鸟类飞行,需要空气动力学,而非羽毛的结构和翅膀的形状」,因此研究智能又不能完全模仿人类智能,而是需要知道是有关世界和智能的基本原则。所有我们同样知道有关我们世界、尤其和我们心智交互的基本原则。这就引出了我们必须关于具身(Embodied)于世界模型(world model)的心智。
尤其是有关基于直觉物理引擎的世界模型(Intuitive Physics Engine: World Model),这就是人类智能具备而传统 AI 不具备的。例如可以假设,生物对重力的感知,就是从环境互动中学来的。通过研究计算发现,在心智中感知的重力,和在现实世界牛顿物理学种类非常接近。
对这个方向认知的研究就是认知科学中的具身认知(Embodied Cognition),这对应于有关智能的是在广阔范围的环境中达成目标的能力的定义。刘嘉认为这是未来 AGI 研究的的重要方向。
意识图灵机:一种可解释的人工智能
美国卡内基梅隆大学计算机科学学院Manuel Blum和Lenore Blum做了有关意识图灵机的报告。
意识图灵机(CTM),是一种能够表达感受而非仅仅模拟的机器,由 <STM, LTM, Up-Tree, Down-Tree, Links, Input, Output> 七元组系统组成,以及每个记忆组块具有 <address, time, gist, weight, intensity, mood> 六种属性,具有确定性和概率性。它是对神经科学家 Bernard Baars 剧场模型和全局空间理论的新理解和数学模型化,但与之在短时记忆中可以具有多重演员(actor)不同的是,CTM 在意识舞台上总是一个相同的演员,该演员可以提出或回答任何问题,或传达任何种类的信息,但扮演获胜的那部分作为最终广播的脚本。
在意识图灵机中,世界建模处理器(The model-of-the-world processor)是一个多模态处理器的例子,它将代理主体从物理世界观察到的多感官信息整合成一种多模态表示(gist),计划对世界上可能的行动,并根据其行动对世界的影响来更新自己(即通过观察新的状态和奖励作为其行动的结果。
作者:心识宇宙团队
内容来源 / Mindverse Research,2022年10月15日
今日编辑 / 范姝含
责任编辑 / 戴晟昱
审稿 / 杨武剑
城市大脑研究院提供开放研讨平台,所有文章仅代表作者个人观点,欢迎共同探讨。原创文章,转载请注明来源:城市大脑研究院。部分图片来源于网络,如涉及版权问题,敬请及时联系我们。